3.7 결정론적 정답지 설계 시의 흔한 함정 (Anti-Patterns) 3.7 결정론적 정답지 설계 시의 흔한 함정 (Anti-Patterns) 3.7.1 과적합(Overfitting) 유발: 테스트 데이터가 프롬프트에 유출(Leakage)되는 경우 3.7.2 지나치게 엄격한 문자열 매칭(Exact String Matching)의 오류 3.7.3 문맥(Context)을 무시한 단편적 사실 검증 3.7.4 유지보수가 불가능한 거대 정답지(Monolithic Ground Truth) 구축 3.7.5 평가 모델(Judge Model) 편향성: 특정 LLM이 생성한 정답을 선호하는 현상